Parámetros de detección (U/V) de EVOC 20 PolySynth

El habla humana está compuesta por una serie de sonidos sonoros (tonales o formantes) y sonidos sordos. La principal diferencia entre los sonidos sonoros y sordos es que los sonidos sonoros se producen por una oscilación de las cuerdas vocales, mientras que los sonidos sordos se producen bloqueando y restringiendo el flujo de aire con los labios, la lengua, el paladar, la garganta y la laringe.

Si se usara habla con sonidos sonoros y sordos como señal de análisis de un vocoder, pero el motor de síntesis no distinguiera entre ambos sonidos, el resultado sería un sonido bastante débil. Para evitar este problema, la sección Synthesis del vocoder debe producir distintos sonidos para las partes sonoras y sordas de la señal.

Por este motivo, EVOC 20 PolySynth incluye un detector de señales sordas/sonoras. Esta unidad detecta las partes sordas del sonido en la señal de análisis y sustituye las partes correspondientes en la señal de síntesis con ruido, con una mezcla de la señal de ruido y sintetizador, o con la señal original. Si el detector U/V detecta partes sonoras, pasa esta información a la sección Synthesis, que usa la señal de síntesis normal para estas partes.

Un formante es un pico en el espectro de frecuencias de un sonido. En el contexto de las voces humanas, los formantes son los componentes clave que permiten a los humanos distinguir entre distintos sonidos vocálicos, tomando como referencia únicamente la frecuencia de los sonidos. El tracto vocal genera los formantes utilizados en el habla humana y al cantar; la mayor parte de los sonidos vocálicos contienen cuatro formantes o más.

Ilustración. Parámetros de “U/V Detection”.

Parámetros de “U/V Detection”